LLM 的成功已經造成非常大的影響,當人們還在爭論 AI 何時會主宰世界時,奇點已經悄悄到來。在 OpenAI 的 ChatGPT 問世後,優異的自然語言處理功能,以及令人驚豔的回答,已經揭示著其對各行各業的影響即將席捲而來。
而最新的 LLM 技術,已經可以通過高級的數學計算考試,更不用說是一般的簡單記憶性問題。也就是說,人類的每個領域,目前都已經可獲益於 LLM 的發展,差別僅在於多和寡而已。因此,了解 LLM 已經是現代科技社會每個人的必備課題。
LLM (Large language model),指的是大語言模型,它通常泛指為使用數量非常龐大,至少數十億以上的參數的深度學習模型,來模擬人類的大腦。
在 LLM 之前的 AI 表現不如現在的 LLM 優異,一個主要的原因就在於深度學習模型的參數不夠多,無法像 LLM 能夠從龐大的資料中學習複雜的模式和關係。
LLM 的核心技術則是使用 Transformer 等現代深度學習演算法來處理和理解自然語言,關於 Transformer 的技術細節,後續將會再另外介紹。
第一個原因是大量的資料讓 LLM 可以學習最泛化 (General) 的自然語言表達方式,得以理解人們的語言並進行任務處理。
再來則是大量的資料才能涵蓋自然語言的上下文關係,讓 LLM 可以推理出最適當的回答內容。
最後則是越複雜的關係,越需要更大量的資料才能有效模擬。也就是這個原因,讓現在的 LLM 已經正式進入硬體計算能力的軍備競賽時代。
越是有固定模式的行業,例如線上基礎問答客服、內容樣板寫作與資料整理師等,都會受到 LLM 的高度影響。例如: 銀行業務自動回覆虛擬助理或虛擬新聞小編等。
反之,若越需要人類的高度整合性思考與情感理解的行業,例如外科醫生、護士、心理治療師等,目前為止則是還無法由 LLM 取代。
面對它,然後擁抱它。在 LLM 時代,必定是需要學習 LLM 使用技能的,就像當年電腦橫掃人類社會一般。但這並不代表不需要學習基礎知識。
相反的,基礎知識掌握的越牢靠,就越能在注意倫理規範下使用 LLM,而不是被 LLM 掌控。
在下一篇中,我們將回顧 LLM 的發展歷史與技術演變,請繼續跟我一起探索!